查看原文
其他

通义听悟:阿里云推出的 AI 音视频转录工具

王平安 AI工具派 2024-03-24

关注 “AI 工具派”

探索最新 AI 工具,发现 AI 带来的无限可能性!


点击获取AI知识库

「近期热门」

  1. 据意查句:清华出品的 AI 文案神器,让你的文案变高级

  2. Tome:基于 AI 自动生成 PPT 的制作工具

  3. Grammarly:帮助你提高英文写作质量的 AI 工具

  4. 分享 17 款优秀的国产 AI 聊天机器人

  5. Gamma:目前最好用的 AI 生成 PPT 工具

  6. DeepL:无比强大的免费 AI 翻译工具

  7. Wiseone:用 AI 帮助你高效阅读和学习
  8. Codeium:强大且免费的AI智能编程助手

今天 Chris 给大家推荐的工具是「通义听悟」,一款阿里云推出的 AI 音视频转录工具,快来一起看看吧。

工具地址:https://tingwu.aliyun.com/

Chris 往期“通义大模型”系列文章回顾:

一、工具介绍 🛠️

通义听悟是一款阿里云推出的 「AI 音视频转录工具」「聚焦于音视频内容的工作学习 AI 助手」,依托通义千问语言模型、音视频 AI 模型能力,帮助用户记录、整理和分析音视频内容,用大模型做音视频笔记、整理会议记录。

目前主要面向以下四类场景:

  • 「企业办公」:OA、IM、CRM等各类办公系统中集成通义听悟,为企业提高会议、面试、访谈、培训、客户交流等场景的信息提取效率。交流内容可回溯、交流重点可查询、相关内容快速定位。
  • 「在线教育」:可将在线课程进行知识点总结、授课主题划分、添加课程字幕。尤其在录播课场景,快速定位回看,一学期的知识点可快速检索定位。二次挖掘授课视频的价值,提高复习的针对性。
  • 「网盘及媒资库」:对存储的音视频内容进行转写、翻译,并提炼核心内容与章节定位,“阅读”音视频文件,提高信息转化效率。
  • 「金融与媒体」:访谈、演讲、路演等交流内容的转写与总结。

二、快速上手 🚀

接下来 Chris 和大家一起体验一下视频转录功能:

1.上传音视频

在主页点击“上传音视频”,然后选择“上传本地音视频文件”:

2.设置音视频配置

这里需要设置:

  • 「音视频语言」:即当前音视频内容的语言;
  • 「翻译」:即打算翻译成什么语言;

然后就可以点击“开始转写”。

3.转写成功,查看详情

接着需要等待转写,转写效率跟视频时长有关系。

等待转写成功后,即可从左侧“我的记录”菜单进入,查看刚才转录的结果:

4.查看转录结果

为了方便查看转录结果,Chris 将视频收起,可以看到智能生成以下内容:

  • 「关键词」:音视频中的关键词;
  • 「全文概要」:音视频内容的概要;
  • 「章节速览」:音视频内容中的主要内容,按照章节划分,并显示时间轴;
  • 「发言总结」:可以对音视频内容进行智能发言总结;
  • 「提取PPT」:将音视频内容中的 PPT 截图提取出来展示,并显示时间轴;
  • 「原文」:按照时间轴进行音视频内容转文本的展示,并支持显示翻译结果;

整体效果还是挺不错的。

三、核心功能 🔍

接下来 Chris 总结一下通义听悟的几个核心功能:

1.音视频转写

通义听悟将音视频内容转写成文本,默认是原文和译文,并且在视频播放过程中,会「自动定位」到当前音视频进度所对应的文本位置,方便查看:

2.音视频概要和总结

通义听悟将音视频转录完成后,会生成该音视频内容的「全文摘要」「章节速览」等内容,更能提高学习效率:

3.记录笔记

通义听悟提供了一个非常不错的编辑器,用来让用户边看视频边记录笔记,非常好用:

并且还可以通过“批量摘取”功能,将转录结果中的内容,快速插入到笔记当中:

4.导出总结

通义听悟支持将当前所有转录内容导出,导出配置包括:

  • 文件内容:英文、中文和双语对照;
  • 文件格式:doc/pdf/srt;
  • PPT
  • 音视频

还可以「选择导出到本地还是阿里云盘」

5.支持多端使用

通义听悟目前支持 Chrome、Edge 浏览器插件,钉钉、微信小程序的使用,非常方便,随时随地可以记录:

6.实时记录和博客链接转写

这两个功能也很常用,大家可以自行体验看看:

  • 「开启实时记录」:实时语音转文字,同步翻译,智能总结要点,可以用在「在线会议的场景」
  • 「播客链接转写」:输入 RSS 订阅链接,无需下载,智能提炼总结,非常方便。

四、收费情况 💰

目前通义听悟还在限时免费体验中,大家可以通过通义听悟的“权益加油站”的活动,「免费获取转写时长」,目前有以下方式:

  1. 「每日登录」,自动签到获取 「10 小时」转写时长;
  2. 「邀请好友」「分享记录给好友」,好友通过链接注册并登录通义听悟,邀请者即可获取 「30 小时」转写时长;
  3. 首次获取「阿里云盘授权」,自动获取 「50 小时」转写时长。

五、总结 📝

通义听悟是阿里云推出的 AI 音视频转录工具,具有音视频转写、生成概要和总结、记录笔记、导出文档等功能,可以高效地提炼和记录音视频中的关键信息。目前限时免费体验中。

Chris 觉得,通义听悟是一个非常实用的工具,可以极大地提高工作学习效率,推荐大家尽快去体验。

这里是“「AI工具派」”,探索最新AI工具,发现AI带来的无限可能性。我们下一期见。


扫码加群/商务合作


探索 AI 无限可能


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存